import pandas as pd
df=pd.read_excel('某店铺2023年1—9月份评价数据.xlsx')
for i in range(len(df['日期'])):
    date=df['日期'].iloc[i]
    if isinstance(date, str):
        df.loc[i,'日期']=date.split('更新于')[1]
df['日期']=pd.to_datetime(df['日期']).dt.date
print(df)

print('处理重复值前数据的行数:', len(df))
df.drop_duplicates(subset=['评价'], inplace=True,ignore_index=True)
print('处理重复值后数据的行数:',len(df))

df.to_excel('某店铺2023年1—9月份评价数据_预处理.xlsx', index=False)

